1. 기계 번역 (Machine Translation)
하나의 언어로 된 문장(Source)을 다른 언어의 문장(Target)으로 자동 번역하는 기술입니다.
인코더-디코더 구조가 대표적이며, 문장의 의미를 이해하고 새로운 문장을 생성하는 능력이 모두 필요합니다.
입력 처리 (인코더)
영어 문장 "I love a dog"이 토큰화 및 임베딩을 거쳐,
문장 전체의 의미를 압축한 문맥 벡터(Context Vector)로 변환됩니다.
의미 번역 (디코더)
디코더는 '문맥 벡터'를 참고하여,
다음에 올 한국어 단어를 순서대로 예측합니다.
출력 생성
생성된 토큰들 ['나', '는', '개', '를', '사랑', '해', '.']을 합쳐
"나는 개를 사랑해 ." 라는 최종 번역 결과를 완성합니다.
세부 Task 예시
신경망 기계 번역 (NMT)
딥러닝 모델로 문맥을 파악해 더 자연스러운 번역문을 생성합니다. (예
구글 번역, 파파고)
텍스트 요약 (Text Summarization)
긴 문서를 짧은 요약문으로 번역하는 Task로 볼 수 있습니다.
문서의 핵심을 이해(인코더)하고 요약문을 생성(디코더)합니다.